{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "# lawzhidao_filter 说明\n",
    "0. **下载地址：** [百度知道](https://pan.baidu.com/s/18Lwq16VBo6wBD_qLb3i33g)\n",
    "1. **数据概览：** 3.6 万条法律问答数据\n",
    "2. **推荐实验：** FAQ 问答系统\n",
    "3. **数据来源：** 百度知道\n",
    "4. **加工处理：**\n",
    "    1. 过滤了id、url、qid、reply_t、user字段\n",
    "    2. 对question、reply做了脱敏处理"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 1,
   "metadata": {},
   "outputs": [],
   "source": [
    "import pandas as pd"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "metadata": {},
   "outputs": [],
   "source": [
    "path = 'lawzhidao_文件夹_所在_路径'"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "# 1. lawzhidao_filter.csv"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## 加载数据"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "metadata": {},
   "outputs": [],
   "source": [
    "pd_all = pd.read_csv(path + 'baoxianzhidao_filter.csv')"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## 字段说明\n",
    "\n",
    "| 字段 | 说明 |\n",
    "| ---- | ---- |\n",
    "| title | 问题的标题 |\n",
    "| question | 问题内容（可为空） |\n",
    "| reply| 回复内容 |\n",
    "| is_best| 是否为页面上显示的最佳回答 |"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "metadata": {
    "scrolled": false
   },
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>title</th>\n",
       "      <th>question</th>\n",
       "      <th>reply</th>\n",
       "      <th>is_best</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>6725</th>\n",
       "      <td>请问车险理赔时，全责一方和无责任一方收到待遇的区别</td>\n",
       "      <td>NaN</td>\n",
       "      <td>这位朋友提问的有些过于笼统了不是很详细，理论上来讲，从商业险的角度分析，有责任，保险公司才会...</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>6399</th>\n",
       "      <td>买保险,一定要找代理人吗,直接去保险公司买不可以吗?</td>\n",
       "      <td>买保险,一定要找代理人吗,直接去保险公司买不可以吗?</td>\n",
       "      <td>可以的。可以自行去保险公司进行投保，也可以选择在网上投保。不过有代理人的好处在于可以为被保险...</td>\n",
       "      <td>1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4242</th>\n",
       "      <td>机动车撞伤人至骨折保险公司该怎么赔偿</td>\n",
       "      <td>NaN</td>\n",
       "      <td>交通事故赔偿是有标准的，因交通事故造成损失，肇事者向受害者、保险公司对承保车辆造成的损失进行...</td>\n",
       "      <td>1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>7481</th>\n",
       "      <td>贷款买养老保险如何办理？</td>\n",
       "      <td>贷款买养老保险如何办理？</td>\n",
       "      <td>助保贷款主要是针对中断缴纳基本养老保险费的接近退休年龄无力续保的困难*员，通过政府担保贴息、...</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5674</th>\n",
       "      <td>摩托车行车证年审应交哪些保险?一定要交驾驶员个人险吗?</td>\n",
       "      <td>NaN</td>\n",
       "      <td>摩托车买保险最应该买的就是交强险，一般根据排量的不同共分为三个类别，其中50CC及以下的排量...</td>\n",
       "      <td>1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1122</th>\n",
       "      <td>惠*安保费贵不贵？一年需要多少钱？</td>\n",
       "      <td>NaN</td>\n",
       "      <td>年缴保费500元，缴费20年，保障30年。</td>\n",
       "      <td>1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5511</th>\n",
       "      <td>农村医保没有交,会把户口注销了吗?本人现不在家无法交医保，乡镇通知我，他说我不交医保就把我的户口</td>\n",
       "      <td>销了。是真的吗？</td>\n",
       "      <td>不会的，这是不合法的，新农合是指由政府组织、引导、支持，农民自愿参加，个人、集体和政府多方筹...</td>\n",
       "      <td>1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>7338</th>\n",
       "      <td>新华保险的保单贷款是怎样还的?</td>\n",
       "      <td>NaN</td>\n",
       "      <td>半年要去签一次息，具体情况，可以直接咨询新华人寿保险公司，新华客服热线9##67</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1280</th>\n",
       "      <td>一起慧99到底有什么优惠相比其他的保险</td>\n",
       "      <td>NaN</td>\n",
       "      <td>您好！一起慧99</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>6388</th>\n",
       "      <td>辞职后，养老保险如果不转移会怎么样</td>\n",
       "      <td>我2010年2月在原公司辞职后，养老保险没有转移。如果不转移，我这部分养老保险会怎么处理？</td>\n",
       "      <td>会被封存，所以要及时转移。养老保险转移和接续手续：一、申请出具《基本养老保险参保缴费凭证》职...</td>\n",
       "      <td>1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>7920</th>\n",
       "      <td>慧*安*儿定期重疾是怎么理赔的</td>\n",
       "      <td>NaN</td>\n",
       "      <td>首先是报案您或被保险人应在知道保险事故发生之日起10日内通知本公司。如果您或受益人故意或者因...</td>\n",
       "      <td>1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3134</th>\n",
       "      <td>构不成住院条件的车祸需要赔付精神损失费误工费营养费护理费吗</td>\n",
       "      <td>NaN</td>\n",
       "      <td>只要存在精神损失、误工、需要增加营养、护理的费用，就可以向侵权人主张赔偿责任。</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4015</th>\n",
       "      <td>基本保险金额是什么意思</td>\n",
       "      <td>基本保险金额是什么意思</td>\n",
       "      <td>基本保险金额是保单上明确标注的金额，保险金额是能拿到的保险赔付金额，有些保险条款的基本保险金...</td>\n",
       "      <td>1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>6848</th>\n",
       "      <td>重大疾病保险有必要买吗？</td>\n",
       "      <td>我今年25岁，身体很健康，我去买保险，保险公司的人给我的计划里有重大疾病保险的项目，但是我只...</td>\n",
       "      <td>重大疾病保险还是很有必要买的。我国的医疗保障体系是由基本医保和商业健康保险组成。如果发生重大...</td>\n",
       "      <td>1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2494</th>\n",
       "      <td>库*勒妇科商业医保报销范围有哪些？</td>\n",
       "      <td>库*勒妇科商业医保报销范围有哪些？</td>\n",
       "      <td>你好，商业医保报销范围比医疗保险报销更广。基本都是能报销的。报销分农村居民和城镇职工：1、居...</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>7341</th>\n",
       "      <td>第三者保险营运与非营运什么区别</td>\n",
       "      <td>第三者保险营运与非营运什么区别</td>\n",
       "      <td>车辆行驶证的“使用性质“一个是营运，一个是非营运。营运需要在运输管理部门办理车辆的道路运输许...</td>\n",
       "      <td>1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4997</th>\n",
       "      <td>犹豫期内退保一定要去原来办理的地点吗?</td>\n",
       "      <td>犹豫期内退保一定要去原来办理的地点吗?</td>\n",
       "      <td>要退保必须去保险公司退，在银行的柜台上是没办法退的，而且退保必须由投保人本人持其身份证去退，...</td>\n",
       "      <td>1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5694</th>\n",
       "      <td>保险法的构成主要包括</td>\n",
       "      <td>NaN</td>\n",
       "      <td>保险法的构成主要包括保险业法、保险合同法*保险特别法。1.保险业法又称保险事业法、保险事业监...</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1604</th>\n",
       "      <td>适合中老年的保险多不多，能买哪些保险？</td>\n",
       "      <td>NaN</td>\n",
       "      <td>年龄多大呢？保费预算多少？</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3098</th>\n",
       "      <td>汽车购置税属于机动车第三者责任险赔偿范围内吗？</td>\n",
       "      <td>NaN</td>\n",
       "      <td>购置税你是你购置车辆的时候上牌还需要交的费用。跟保险不是一个范围。</td>\n",
       "      <td>0</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "                                                 title  \\\n",
       "6725                         请问车险理赔时，全责一方和无责任一方收到待遇的区别   \n",
       "6399                        买保险,一定要找代理人吗,直接去保险公司买不可以吗?   \n",
       "4242                                机动车撞伤人至骨折保险公司该怎么赔偿   \n",
       "7481                                      贷款买养老保险如何办理？   \n",
       "5674                       摩托车行车证年审应交哪些保险?一定要交驾驶员个人险吗?   \n",
       "1122                                 惠*安保费贵不贵？一年需要多少钱？   \n",
       "5511  农村医保没有交,会把户口注销了吗?本人现不在家无法交医保，乡镇通知我，他说我不交医保就把我的户口   \n",
       "7338                                   新华保险的保单贷款是怎样还的?   \n",
       "1280                               一起慧99到底有什么优惠相比其他的保险   \n",
       "6388                                 辞职后，养老保险如果不转移会怎么样   \n",
       "7920                                   慧*安*儿定期重疾是怎么理赔的   \n",
       "3134                     构不成住院条件的车祸需要赔付精神损失费误工费营养费护理费吗   \n",
       "4015                                       基本保险金额是什么意思   \n",
       "6848                                      重大疾病保险有必要买吗？   \n",
       "2494                                 库*勒妇科商业医保报销范围有哪些？   \n",
       "7341                                   第三者保险营运与非营运什么区别   \n",
       "4997                               犹豫期内退保一定要去原来办理的地点吗?   \n",
       "5694                                        保险法的构成主要包括   \n",
       "1604                               适合中老年的保险多不多，能买哪些保险？   \n",
       "3098                           汽车购置税属于机动车第三者责任险赔偿范围内吗？   \n",
       "\n",
       "                                               question  \\\n",
       "6725                                                NaN   \n",
       "6399                         买保险,一定要找代理人吗,直接去保险公司买不可以吗?   \n",
       "4242                                                NaN   \n",
       "7481                                       贷款买养老保险如何办理？   \n",
       "5674                                                NaN   \n",
       "1122                                                NaN   \n",
       "5511                                           销了。是真的吗？   \n",
       "7338                                                NaN   \n",
       "1280                                                NaN   \n",
       "6388      我2010年2月在原公司辞职后，养老保险没有转移。如果不转移，我这部分养老保险会怎么处理？   \n",
       "7920                                                NaN   \n",
       "3134                                                NaN   \n",
       "4015                                        基本保险金额是什么意思   \n",
       "6848  我今年25岁，身体很健康，我去买保险，保险公司的人给我的计划里有重大疾病保险的项目，但是我只...   \n",
       "2494                                  库*勒妇科商业医保报销范围有哪些？   \n",
       "7341                                    第三者保险营运与非营运什么区别   \n",
       "4997                                犹豫期内退保一定要去原来办理的地点吗?   \n",
       "5694                                                NaN   \n",
       "1604                                                NaN   \n",
       "3098                                                NaN   \n",
       "\n",
       "                                                  reply  is_best  \n",
       "6725  这位朋友提问的有些过于笼统了不是很详细，理论上来讲，从商业险的角度分析，有责任，保险公司才会...        0  \n",
       "6399  可以的。可以自行去保险公司进行投保，也可以选择在网上投保。不过有代理人的好处在于可以为被保险...        1  \n",
       "4242  交通事故赔偿是有标准的，因交通事故造成损失，肇事者向受害者、保险公司对承保车辆造成的损失进行...        1  \n",
       "7481  助保贷款主要是针对中断缴纳基本养老保险费的接近退休年龄无力续保的困难*员，通过政府担保贴息、...        0  \n",
       "5674  摩托车买保险最应该买的就是交强险，一般根据排量的不同共分为三个类别，其中50CC及以下的排量...        1  \n",
       "1122                              年缴保费500元，缴费20年，保障30年。        1  \n",
       "5511  不会的，这是不合法的，新农合是指由政府组织、引导、支持，农民自愿参加，个人、集体和政府多方筹...        1  \n",
       "7338           半年要去签一次息，具体情况，可以直接咨询新华人寿保险公司，新华客服热线9##67        0  \n",
       "1280                                           您好！一起慧99        0  \n",
       "6388  会被封存，所以要及时转移。养老保险转移和接续手续：一、申请出具《基本养老保险参保缴费凭证》职...        1  \n",
       "7920  首先是报案您或被保险人应在知道保险事故发生之日起10日内通知本公司。如果您或受益人故意或者因...        1  \n",
       "3134            只要存在精神损失、误工、需要增加营养、护理的费用，就可以向侵权人主张赔偿责任。        0  \n",
       "4015  基本保险金额是保单上明确标注的金额，保险金额是能拿到的保险赔付金额，有些保险条款的基本保险金...        1  \n",
       "6848  重大疾病保险还是很有必要买的。我国的医疗保障体系是由基本医保和商业健康保险组成。如果发生重大...        1  \n",
       "2494  你好，商业医保报销范围比医疗保险报销更广。基本都是能报销的。报销分农村居民和城镇职工：1、居...        0  \n",
       "7341  车辆行驶证的“使用性质“一个是营运，一个是非营运。营运需要在运输管理部门办理车辆的道路运输许...        1  \n",
       "4997  要退保必须去保险公司退，在银行的柜台上是没办法退的，而且退保必须由投保人本人持其身份证去退，...        1  \n",
       "5694  保险法的构成主要包括保险业法、保险合同法*保险特别法。1.保险业法又称保险事业法、保险事业监...        0  \n",
       "1604                                      年龄多大呢？保费预算多少？        0  \n",
       "3098                  购置税你是你购置车辆的时候上牌还需要交的费用。跟保险不是一个范围。        0  "
      ]
     },
     "execution_count": 4,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "pd_all.sample(n=20)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.7.0"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
}
